Cos'è distribuzione geometrica?

Distribuzione Geometrica

La distribuzione geometrica è una distribuzione di probabilità discreta che descrive il numero di prove di Bernoulli necessarie per ottenere il primo successo. In altre parole, modella la probabilità che il primo successo si verifichi alla k-esima prova.

Definizione:

Una variabile aleatoria X ha distribuzione geometrica con parametro p (0 < p ≤ 1) se la sua funzione di massa di probabilità (PMF) è data da:

P(X = k) = (1 - p)^(k-1) * p

dove:

  • X è il numero di prove necessarie per ottenere il primo successo.
  • k è un intero positivo (k = 1, 2, 3, ...).
  • p è la probabilità di successo in una singola prova (costante).
  • (1 - p) è la probabilità di fallimento in una singola prova.

Assunzioni chiave:

  • Le prove sono indipendenti.
  • La probabilità di successo p è costante per ogni prova.
  • Siamo interessati al numero di prove necessarie fino al primo successo.

Due formulazioni:

Esistono due varianti principali della distribuzione geometrica:

  1. Numero di prove fino al primo successo (inclusa la prova di successo): Questa è la definizione sopra descritta, dove X conta il numero totale di prove effettuate, inclusa quella che ha portato al successo. L'implementazione descritta sopra usa questa formulazione.
  2. Numero di fallimenti prima del primo successo: In questa variante, X conta il numero di fallimenti prima della prova di successo. La PMF in questo caso sarebbe P(X = k) = (1 - p)^k * p , con k che parte da 0.

Proprietà importanti:

  • Valore atteso (Media): E[X] = 1/p (per la versione "numero di prove") oppure (1-p)/p (per la versione "numero di fallimenti").
  • Varianza: Var(X) = (1 - p)/p² (per la versione "numero di prove") oppure (1-p)/p^2 (per la versione "numero di fallimenti").
  • Assenza di memoria (Memoryless property): La distribuzione geometrica gode della proprietà di assenza di memoria, il che significa che la probabilità di successo alla prova successiva è indipendente dal numero di fallimenti precedenti. Formalmente, P(X > s + t | X > s) = P(X > t). Questo significa che se hai già effettuato s tentativi falliti, la probabilità di avere successo dopo altri t tentativi è la stessa che avresti avuto all'inizio.

Esempi di applicazioni:

La distribuzione geometrica è utilizzata in diversi ambiti, tra cui:

  • Controllo di qualità: Stimare il numero di elementi da ispezionare prima di trovare un elemento difettoso.
  • Marketing: Stimare il numero di chiamate necessarie per effettuare la prima vendita.
  • Giochi d'azzardo: Calcolare la probabilità di lanciare un dado un certo numero di volte prima di ottenere un certo risultato (ad esempio, un sei).
  • Affidabilità: Stimare il tempo di funzionamento di un sistema prima che si verifichi il primo guasto.

Relazioni con altre distribuzioni:

In sintesi, la distribuzione geometrica è uno strumento utile per modellare il numero di prove necessarie per ottenere il primo successo in una serie di prove di Bernoulli indipendenti. Il parametro chiave è p, la probabilità di successo in una singola prova. La proprietà di assenza di memoria la rende particolarmente adatta a situazioni in cui gli eventi passati non influenzano la probabilità di successo futuro.